Pembelajaran Mendalam pada dasarnya merupakan evolusi dari Pembelajaran Mesin klasik, yang memandang pengenalan pola yang kompleks sebagai pendekatan fungsi berdimensi tinggi masalah. Bidang ini bergantung pada peningkatan teknik-teknik aljabar linear dan optimasi yang telah terbukti, beralih dari model-model klasik dengan parameter rendah (seperti SVM standar atau regresi linear) ke model yang melibatkan jutaan hingga miliaran parameter. Keberhasilan memerlukan kemampuan dalam mendefinisikan hubungan kompleks ini menggunakan notasi matriks yang efisien. aljabar linear and optimization techniques, transitioning from low-parameter classical models (like standard SVMs or linear regression) to models involving millions or billions of parameters. Success requires fluency in defining these complex relationships using efficient matrix notation.
1. Struktur Inti: Pendekatan Fungsi dengan Parameter Tinggi
Jaringan saraf dalam dibangun dengan menumpuk transformasi linear sederhana (perkalian matriks menggunakan bobot $W$ dan bias $b$) yang dipisahkan oleh fungsi aktivasi non-linear elemen demi elemen. Arsitektur ini memungkinkan jaringan untuk secara otomatis mempelajari hierarki fitur yang semakin abstrak dan kompleks langsung dari input mentah.
2. Koneksi Kunci: Kalkulus Multivariat dan Backpropagation
Pelatihan model-model besar ini melibatkan meminimalkan fungsi kerugian $L(\theta)$ atas semua parameter jaringan $\theta$. Proses ini membutuhkan perhitungan gradien $\nabla_{\theta} L$ secara efisien di setiap parameter tunggal menggunakan algoritma yang disebut Backpropagation, yang merupakan penerapan langsung dari Aturan Rantai multivariat diferensiasi.
The weights $W$ have dimension $(D \times K)$. Therefore, the gradient $\frac{\partial L}{\partial W}$ must also be $(D \times K)$ to perform the parameter update $W := W - \eta \frac{\partial L}{\partial W}$.